สถิติในฐานะการแปลง
สถิติถูกนิยามอย่างเป็นทางการว่าเป็นฟังก์ชัน $h: \mathbb{R}^n \to \mathbb{R}$ เราจะกำหนดความน่าจะเป็นที่ตัวสถิติจะตกอยู่ในเซต $B$ โดยใช้ภาพกลับ (pre-image):
$$h^{-1} B = \{(x_1, x_2, \dots, x_n) : h(x_1, x_2, \dots, x_n) \in B\}$$
รากฐานของตัวแปรอิสระและเหมือนกัน (i.i.d.)
สำหรับตัวอย่างของตัวแปรสุ่มที่เป็นอิสระและมีการแจกแจงเหมือนกัน (i.i.d.) ความน่าจะเป็นร่วมของจุดตัวอย่างเฉพาะเจาะจง $(x_1, \dots, x_n)$ คือผลคูณของความน่าจะเป็นตามขอบเขต: $p(x_1)p(x_2)\dots p(x_n)$ ผลคูณนี้ทำหน้าที่เป็นน้ำหนักให้แต่ละจุดเมื่อคำนวณความน่าจะเป็นรวมที่ตัวสถิติจะมีค่าเฉพาะ
พิจารณาประชากรแบบแยกประเภทที่ $p_X(1) = 1/2$, $p_X(2) = 1/4$, และ $p_X(3) = 1/4$ เราสุ่มตัวอย่างขนาด $n=2$ ($X_1, X_2$) และนิยามตัวสถิติของเราเป็นค่าเฉลี่ยเรขาคณิต: $Y_2 = (X_1 X_2)^{1/2}$
เพื่อหาการแจกแจงของ $Y_2$ เราจะแสดงรายการคู่ทั้งหมด 9 คู่ที่เป็นไปได้ $(X_1, X_2)$ คำนวณความน่าจะเป็นร่วม และค่า $Y_2$ ที่ได้มา:
| คู่ $(x_1, x_2)$ | ความน่าจะเป็น $P(x_1)P(x_2)$ | $Y = \sqrt{x_1 x_2}$ |
|---|---|---|
| (1, 1) | 1/4 | 1.000 |
| (1, 2), (2, 1) | 1/8 + 1/8 = 1/4 | 1.414 |
| (1, 3), (3, 1) | 1/8 + 1/8 = 1/4 | 1.732 |
| (2, 2) | 1/16 | 2.000 |
| (2, 3), (3, 2) | 1/16 + 1/16 = 1/8 | 2.449 |
| (3, 3) | 1/16 | 3.000 |
การแจกแจงแบบแม่นตรงเทียบกับแบบเชิงเส้น
ก่อนที่จะไปสู่ทฤษฎีบทเชิงขีดจำกัด เช่น ทฤษฎีบทกลางของคลัสเตอร์ (CLT) เราต้องเข้าใจการแจกแจงแบบ "แม่นตรง" ก่อน ซึ่งเกี่ยวข้องกับการคำนวณฟังก์ชันมวลหรือความหนาแน่นของความน่าจะเป็นเฉพาะสำหรับตัวสถิติเมื่อมี $n$ ที่เล็กและจำกัด เมื่อรูปแบบเชิงวิเคราะห์กลายเป็นเรื่องยาก เราจะใช้การจำลองเชิงตัวเลข เช่น **การประมาณแบบมอนต์คาร์โล**